Nueva herramienta en la lucha contra el Spam mediante la tecnología NeuNet de BitDefender

01March 2007

Barcelona, 14 de febrero de 2007

BitDefender ha desarrollado una estructura de redes neuronales que puede clasificar una gran cantidad de datos rápidamente sin afectar la rapidez de detección AntiSpam.

VISIÓN GENERAL SOBRE EL SPAM

En los últimos años, los usuarios de correo electrónico de todo el mundo han visto incrementarse de forma alarmante los mensajes de correo electrónico no solicitados que les llegan a sus cuentas de correo, hasta convertirse en una verdadera epidemia on-line. De la misma manera, un gran número de tipos de filtro han ido apareciendo para solventar este problema: Bayesiano, Lista Negra / Lista Blanca, Imágenes, Filtro URL y Heurístico, entre otros.

El método que hay tras cualquier técnica de filtro antispam (Heurístico, de Probabilidad o basado en palabras claves) es el mismo: como el spam suele tener una estructura diferente a los correos legítimos, una buena manera de identificarlos y bloquearlos es detectando estas diferencias. Analizando los resultados de estos modos de filtraje y debido a que el spam cambia cada día, el mejor método para solventar este problema debería ser el de usar todas estas características para un efecto combinado y más preciso.

¡Más fácil decir que hacer! Desde el surgimiento de estas tecnologías, los spammers van mejorando cada vez más sus técnicas, de manera que el spam sigue llegando a su destino. El correo no deseado está utilizando nuevas formas de despistar a los filtros, encriptando palabras que sólo un humano podría entender. Han aprovechado las vulnerabilidades del lenguaje HTML e, incluso, han ocultado el contenido de tal manera que sería casi imposible para un ordenador encontrar la diferencia.

Las soluciones antispam han tenido que incrementar la frecuencia de sus actualizaciones y desarrollar un mayor número de técnicas heurísticas en menos tiempo. La necesidad de automatizar un proceso que pueda aprender rápidamente las nuevas formas de spam sin afectar a la precisión de la detección más reciente del mismo, se ha convertido en algo esencial.

La solución que BitDefender ha desarrollado para solventar este problema radica en la red neural artificial o como se ha venido a denominar: Tecnología NeuNet.

SOBRE LAS "REDES NEURALES"

Una red neural se conforma de un amplio número de elementos de procesamiento denominados neuronas. Cada neurona tiene un estado interno llamado nivel de activación o de actividad, que se presenta en función de las entradas que ha recibido. Generalmente, una neurona envía su activación como una señal a otras. Un neural puede enviar una sola señal en un momento determinado, aunque dicha señal pueda alcanzar varias neuronas.

Una red artificial neural puede también verse como un paradigma del procesamiento de información inspirado en la manera en la que un sistema nervioso biológico, como el cerebro humano, procesa la información. Las redes neurales se diferencian de los equipos convencionales por su manera de solucionar los problemas. Los equipos convencionales utilizan un sistema algorítmico. Por ejemplo, los ordenadores siguen una serie de instrucciones para solventar el problema.

En el caso de que los pasos que el ordenador tenga que seguir no sean conocidos, no se podrá resolver. Esto restringe la capacidad de solucionar problemas del ordenador a los ya conocidos, aquellos que se entiendan y sepan solucionar. Adicionalmente, los ordenadores convencionales utilizan un enfoque cognitivo para solventar problemas; la manera en la cual se tiene que solucionar un problema tiene que ser conocido y explicado con pequeñas instrucciones inequívocas. Estas instrucciones son posteriormente convertidas en un lenguaje de programación de alto nivel y después en un código que el ordenador pueda interpretar. Estas máquinas son completamente previsibles; si algo falla es debido a un error de software o hardware.

Las redes neurales y los equipos con algoritmos convencionales no pueden competir, pero se complementan. Ciertas tareas, como las operaciones aritméticas, son más apropiadas para un sistema algorítmico, mientras que otras requieren redes neurales. La combinación de estos dos sistemas (normalmente un equipo convencional se utiliza para supervisar la red neural) da una máxima efectividad.

NUEVA ESTRUCTURA UTILIZANDO LAS REDES NEURALES

La idea de BitDefender fue la de crear un proceso automático que reuniese el spam y el ham (correo válido) durante un período de tiempo, estudiando sus características y aprendiendo de forma inteligente, sin necesidad de un ser humano como intermediario. Cuanto más rápido se realice el proceso, más rápida será la respuesta.

Sin embargo, las redes neurales tienen algunos problemas. Cuando se encuentran con una gran cantidad de datos, los resultados tienden a disminuir. Las redes reactivas neurales tienden a olvidar información aprendida al principio del proceso, o los datos de salida se convierten de alguna manera en datos caóticos. Basado en este conocimiento, como también en el hecho de que el spam puede dividirse en diferentes categorías, BitDefender ha desarrollado un árbol de redes neurales que puede clasificar una gran cantidad de datos rápidamente y sin afectar la precisión de la detección.

Cada red neural, en su jerarquía, trabaja sobre un distinto tipo de spam. Es por eso que las entradas y salidas están limitadas para no confundir a la red y para mantener un alto rendimiento.

Un buen ejemplo es el hecho de que se haya creado una subcategoría denominada fraude que contiene mensajes que intentan engañar al usuario para enviar dinero o proporcionar información sobre su tarjeta de crédito.

Además, se ha identificado un subtipo de fraude denominado phishing, con sus ingeniosas variantes: una vez, un spammer intentó robar información de la tarjeta de crédito de un usuario haciéndose pasar por un nigeriano rico que, supuestamente quería sacar dinero de su país y pidió su ayuda, enviándole una pequeña cantidad de dinero; otras veces es el timo de la lotería, donde el spammer intenta obtener información personal de un usuario afirmando que ha ganado unos cuantos millones de dólares en la lotería; y no olvidemos la historia de las acciones, donde recibes información acerca de cómo como comprar acciones. Es obvio que todas estas situaciones tienen algo en común y que pueden componer una categoría por si mismas. Cada subtipo tiene sus propias características diferenciadoras, las cuales permiten aumentar más estas subcategorías.

Durante el entrenamiento, si la red neural no encuentra una categoría en la que pueda integrar un determinado modelo, creará una nueva categoría. Por tanto, si se suministra a la red neural una variedad de spam muy amplia, el número de categorías se incrementa, lo que podría ralentizar el análisis. No obstante, si la red neural se especializase en un solo tipo de spam, incluso con un número alto de heurísticos, se evitaría el flujo rápido de las categorías de salida y el análisis sería más preciso.

Suponiendo que la jerarquía de las redes neurales hubiese sido entrenada y estuviese lista para hacer pruebas, cuando un email llega, el sistema debería proveer y responder acorde con su naturaleza: legítimo, spam (cierto tipo) o no se (lo que podría también considerarse legítimo para prevenir falsos positivos). Primero se analiza con los tipos generales de heurísticos para detectar la categoría en la cual se podría incluir.

Si no se adaptase a ninguna de las categorías, el mail se considerará legítimo; en caso contrario, será enviado a la siguiente red neural que trata ese tipo de spam y el algoritmo se repetirá. En este punto, se extrae información, pero sólo la imprescindible para la entrada necesaria para la red neural en cuestión. Si el siguiente nivel que alcanza el correo es otra red neural, la información sería transmitida y el algoritmo se repetiría. Si el mail no pudiese ser calificado, contaría como legítimo pero si el siguiente nivel es una categoría final (un nodo del árbol) el mail sería clasificado y el proceso terminaría.

Por tanto, el proceso trabaja sobre una base de extracción selectiva de información, que estimula la rapidez del análisis. Además, el enfoque de las redes neurales es más efectivo, certero y fiable a la hora de llevar a cabo esta tarea.

EFICACIA

El índice de detección mejora considerablemente cuando se añaden nuevas entradas, pudiendo fácilmente incrementarse hasta casi un 100%. El número de heurísticos que puede añadirse es infinito, sin tener que preocuparse por el tiempo de ejecución. El elemento clave en la detección no es la cantidad de heurísticos que tenemos, sino los patrones que se descubren en la fase de aprendizaje. Una determinada palabra clave en un correo no quiere decir que este sea spam, pero tampoco que no lo sea. Un patrón es una lista completa de elementos clave encontrados en el cuerpo del correo; el proceso de análisis se iniciará aunque se detecte sólo una palabra. Si durante el aprendizaje, un mensaje similar hubiera entrado en la red neural, el proceso de análisis lo habría identificado correctamente.

Los experimentos de BitDefender han demostrado que el uso de redes neurales es mucho más refinado, más matemático y, potencialmente, mucho más fiable y preciso a la hora de llevar a cabo su objetivo. Utilizando exclusivamente este filtro (BitDefender NeuNet tecnología pendiente de patente) en una muestra de más de dos millones de mensajes (de los que el 80% fueron exclusivamente utilizados en el proceso de aprendizaje y el 20% en pruebas) se consiguió el 100% de detección sobre las muestras de aprendizaje y un 97,56 % sobre las muestras de prueba. El sistema funcionó mucho más rápido que un filtro heurístico.

Como conclusión, se considera el filtro de redes neurales como el siguiente nivel en la lucha contra el spam.

RECONOCIMIENTOS

El antispam de BitDefender obtuvo recientemente el prestigioso galardón Checkmark Premium Certification con un resultado del 97% de efectividad a la hora de bloquear mensajes de spam, obteniendo así la más alta certificación posible. Esta nueva tecnología antispam fue probada como parte de la solución completa de protección para servidores de correo electrónico BitDefender Mail Protection for Enterprises.

El antispam de BitDefender también incluye otras características, entre las que destaca su avanzado filtro de archivos de imágenes y una actualizada y completa base de datos de firmas de spam y URL.

Últimas noticias

Business Insights

HOTforSecurity

Bitdefender Lab

IoT Insights